237 research outputs found

    Donner du sens à des documents semi-structurés : de la construction d'ontologies à l'annotation sémantique

    Get PDF
    Chapitre 05 : Donner du sens Ă  des documents semi-structurĂ©s : de la construction d'ontologies Ă  l'annotation sĂ©mantiqueNational audiencePartie 1 : construction et peuplement d'ontologies à partir de textes : démarche générale - critères de bonne structuration d'une ontologie - outils de Traitement Automatique des Langues pour faciliter la construction d'ontologies - ouvertures Partie 2 : "donner du sens" à des contenus : l'annotation sémantique : associer des données et des modèles sémantiques - démarche générale - quel type de ressource pour caractériser "sémantiquement" des contenus/ des données ? - où l'on retrouve le TAL / ouverture

    Variation syntaxique et contextuelle dans la mise au point de patrons de relations sémantiques

    Get PDF
    Depuis une quinzaine d'annĂ©es, des marqueurs linguistiques sont employĂ©s comme un moyen potentiel de repĂ©rer des relations conceptuelles en corpus. Il s'agit d'Ă©lĂ©ments formels (typographiques, lexicaux, syntaxiques) dont on fait l'hypothĂšse qu'ils peuvent ĂȘtre utilisĂ©s de maniĂšre plus ou moins systĂ©matique pour accĂ©der, dans des textes, Ă  une relation lexicale ou mieux conceptuelle, dĂ©terminĂ©e a priori (le plus souvent, hyperonymie, mĂ©ronymie, cause). Ce processus c'est ni immĂ©diat ni complĂštement automatique. Il porte d'abord sur la sĂ©lection d'un certain nombre de phrases dont une partie est conforme au schĂ©ma dĂ©fini par le patron. Il requiert ensuite une interprĂ©tation, Ă©ventuellement guidĂ©e par des suggestions faites sur la base des hypothĂšses de la signification a priori de ces patrons, pour identifier des termes en relation et la sĂ©mantique de cette relation. Enfin, la derniĂšre Ă©tape consiste Ă  s'Ă©loigner un peu plus du texte pour dĂ©cider d'une reprĂ©sentation conceptuelle de la relation. Ce chapitre se propose d'interroger la variation du fonctionnement des marqueurs en croisant les regards du TAL, de l'IC et de la linguistique de corpus

    Variation and Semantic Relation Interpretation: Linguistic and Processing Issues

    Get PDF
    International audienceStudies in linguistics define lexico-syntactic patterns to characterize the linguistic utterances that can be interpreted with semantic relations. Because patterns are assumed to reflect linguistic regularities that have a stable interpretation, several software implement such patterns to extract semantic relations from text. Nevertheless, a thorough analysis of pattern occurrences in various corpora proved that variation may affect their interpretation. In this paper, we report the linguistic variations that impact relation interpretation in language, and may lead to errors in relation extraction systems. We analyze several features of state-of-the-art pattern-based relation extraction tools, mostly how patterns are represented and matched with text, and discuss their role in the tool ability to manage variation

    Corpus et terminologie

    Get PDF
    International audienceLes liens entre ressources termino-ontologiques et corpus intéressent la linguistique de corpus, la terminologie, l'informatique et les sciences de l'information. Des difficultés théoriques et techniques communes, se dégage la nécessité d'approfondir la notion de genre, de mieux prendre en compte les questions d'usage et de maintenance ainsi que les modalités d'évaluation des ressources et des outils de construction. Mots-clés : ontologie, terminologie, thesaurus, corpus, ingénierie des langues et des connaissances, sciences de l'information Abstract The link connecting terminological and ontological resources with corpora may concern corpus linguistics, terminology, knowledge engineering or information sciences. Similar theoretical and technical issues underline the need to specify the notion of genre, to better integrate use and maintenance issues and to define evaluation protocols for the resources and their building tools

    From the knowledge acquisition bottleneck to the knowledge acquisition overflow: A brief French history of knowledge acquisition

    Get PDF
    International audienceThis article is an account of the evolution of the French-speaking research community on knowledge acquisition and knowledge modelling echoing the complex and cross-disciplinary trajectory of the field. In particular, it reports the most significant steps in the parallel evolution of the web and the knowledge acquisition paradigm, which finally converged with the project of a semantic web. As a consequence of the huge amount of available data in the web, a paradigm shift occurred in the domain, from knowledge-intensive problem solving to large-scale data acquisition and management. We also pay a tribute to Rose Dieng, one of the pioneers of this research community

    Construction automatique d'ontologies à partir de spécifications de bases de données

    Get PDF
    National audienceLes méthodes classiques de construction automatiques d'ontologies à partir de textes exploitent le texte proprement dit. Nous étendons ces approches en prenant en compte la structure du texte, élément porteur d'information. Pour cela, nous nous basons sur des documents de spécifications de bases de données au format XML, pour lesquels le découpage structurel du texte correspond à une caractérisation sémantique de son contenu. L'idée est de tirer profit à la fois de la structure du texte et du texte rédigé. La méthode proposée consiste à utiliser la sémantique des balises et à caractériser leurs relations pour définir des rÚgles de création de concepts et de relations sémantiques. Un noyau d'ontologie a été ainsi construit automatiquement à l'aide de ces rÚgles, noyau ensuite enrichi par l'exploitation du texte en langage naturel à l'aide de patrons lexico-syntaxiques définis. RÚgles et patrons ont été implémentés sous Gate

    Correction d'ontologies construites Ă  partir de la structure de documents

    Get PDF
    National audienceLes logiciels de construction d'ontologies Ă  partir de textes rĂ©alisent une interprĂ©tation fixĂ©e a priori du contenu des textes, qu'un expert du domaine ou une ontologie doit vĂ©rifier. Or une Ă©tude prĂ©cise des limites des techniques d'analyse des textes permet de guider la correction de l'ontologie apprise en dĂ©finissant des rĂšgles d'aide Ă  la correction. Ces rĂšgles attirent l'attention de l'ontographe sur des parties d'ontologie contenant des « anomalies » et tiennent compte du texte d'origine et de l'analyse rĂ©alisĂ©e pour proposer des corrections. Dans cet article, nous illustrons la notion de rĂšgle de correction dans le cas oĂč les connaissances apprises viennent de l'exploitation de structures Ă©numĂ©ratives parallĂšles prĂ©sentes en corpus

    Tùche, domaine et application : influences sur le processus de modélisation de connaissances

    Get PDF
    National audienceUn nombre croissant d'outils de gestion de documents et de connaissances a désormais recours à des ressources terminologiques et/ou ontologiques (RTO) pour répondre à leurs besoins applicatifs. Nous montrons que le processus de modélisation de telles ressources passe par la prise en compte de la nature du domaine, de la tùche et de l'application visés. Pour cela, nous nous appuyons sur une étude de cas de construction de RTO à partir de textes dans le domaine du diagnostic automobile

    Modélisation de Ressources Termino-Ontologiques en OWL

    Get PDF
    National audienceDans le cadre de recherches menées sur l'indexation sémantique, nous avons été conduits à nous interroger sur l'efficacité générale des modÚles actuels de représentation des terminologies au sein des ontologies. AprÚs avoir évoqué leurs limites actuelles, nous proposons un nouveau modÚle pour manipuler une ressource termino-ontologique en OWL et nous en décrivons son implémentation prochaine au sein de l'environnement Protégé
    • 

    corecore